DOI: 10.3901/JME.20** 9 1%% 
多 SoftMax 卷 积 神经 网 络 及 其 在 行星 齿轮 箱 复 杂 故 
障 诊断 中 的 应 用 
单 建华 BAG ER Xxx 


(安徽 工业 大 学 机 械 工程 学 院 马鞍 山 243002) 


摘要 : 现 有 行星 齿轮 箱 故 障 诊断 方法 存在 不 足 : 一 是 传统 方法 复杂 ， 且 不 能 有 效 诊 断 行 星 齿 轮 故 障 类 型 。 二 是 基于 卷 积 神经 
网 络 的 方法 主要 用 于 诊断 齿轮 箱 故 障 ， 很 少 用 来 诊断 行星 齿轮 箱 。 为 有 效 诊断 复杂 的 故障 类 型 和 变 工 况 ， 本 文 首次 提出 了 故 
障 树 形 结构 、 工 况 并 列 结 构 和 多 SoftMax 卷 积 神经 网 络 。 故 障 树 形 结构 能 统一 处 理 各 种 复杂 故障 类 型 ， 还 能 查看 各 个 节点 的 
诊断 效果 。 工 况 并 列 结构 能 处 理 变 工 况 ， 预 测 转速 和 载荷 。 采 用 实验 室 行星 齿轮 箱 的 振动 数据 ， 进 行 了 一 系列 测试 ， 表 明了 
本 方法 能 够 准确 诊断 行星 齿轮 箱 复 杂 故 障 和 变 工 况 ， 准 确 率 达 97%, 验证 了 多 SoftMax 卷 积 神经 网 络 强 的 泛 化 能 力 ， 以 及 故 
障 树 形 结构 的 优势 。 
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Multi-SoftMax Convolution Neural Network and Its Application in the 
Diagnosis of Planetary Gearbox Complicated Faults 


SHAN Jianhua LV Qin ZHANG Shenln MENG Rui WANG Xiaoyi 
(School of Mechanical Engineering, Anhui University of Technology, Maanshan 243002) 


Abstract: There are some shortcomings in the existing methods of fault diagnosis of planetary gearbox: First, the traditional methods 
are complex and can not effectively diagnose the planetary gearbox faults. Second, the methods based on convolution neural network 
mostly diagnose gearbox faults and rarely are used to diagnose planetary gearbox. In order to effectively diagnose complex faults and 
variable working conditions, fault tree structure, working condition parallel structure and multi-SoftMax convolution neural network 
are proposed for the first time. Fault tree structure can handle a variety of complex faults and see the diagnosis effect of each node. 
The parallel structure can handle variable conditions, and predict speed and load. A series of experiments are carried out using the 
vibration data of ours laboratory planetary gearbox, which indicated that the method can accurately diagnose the complex faults and 
variable working conditions of the planetary gearbox, and the accuracy is 97%. It is verified that the multi-SoftMax convolution 
neural network has strong generalization ability, and the advantages of the fault tree structure. 


Key words: Fault diagnosis; Planetary gearbox; Deep learning; Convolution neural network 
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章 诊 断 间 题 具有 自身 的 特点 和 难点 B]。 为 此 ， 
0 前言 外 学 者 对 此 进行 了 大 量 研究 。 
加 拿 大 多 伦 多 大 学 的 YU 外 提出 了 基于 小 波 变换 
行星 齿轮 箱 具 有 传动 比 大 ， 体 积 小 ， 承 载 能 和 时 域 平均 的 行星 齿轮 箱 故 障 诊断 方法 , 2017 FW 
大 等 优点 ， 因 此 广泛 运用 于 风力 发 电 、 冶 金 、 船 舶 。” 南大 学 的 程 军 圣 提出 了 基于 ASTFA 和 SDE0 调节 的 
和 起 重 运输 等 。 一 旦 发 生 故 障 ， 会 造成 严重 的 安全 ”行星 齿轮 箱 故 障 诊断 方法 ; 2016 年 哈尔滨 工业 大 学 
事故 ， 因 此 行星 齿轮 箱 故 障 诊断 显得 尤其 重要 [2。 的 黄 文 涛 器 提出 了 基于 自 适 应 优化 品质 因子 的 共振 
行星 齿轮 箱 中 齿轮 运动 是 典型 的 复合 运动 ， 其 振动 稀疏 分 解 方 法 的 行星 齿轮 箱 故 障 诊 断 方法 。 上 述 方 
各 应 比 轴承 和 定 轴 传 动 齿 轮 箱 更 为 复杂 ， 相 应 的 故 ” 法 只 适用 于 稳 态 工 况 、 数 学 方法 复杂 以 及 诊断 效果 
不 佳 。 为 克服 这 些 方 法 存在 的 不 足 ， 需 提出 一 种 创 
* 国家 自然 科学 基金 资助 项 目 (51405001，51375014) 新 的 方法 来 解决 行星 齿轮 箱 的 故障 诊断 问题 。 
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近 几 年 ， 深 度 学 习作 为 机 器 学 习 的 一 个 最 新 最 
热 领 域 ， 发 展 迅速 ， 在 自然 语言 处 理 、 图 像 识别 等 
领域 取得 了 巨大 成 功 ， 以 其 强大 的 特征 学 习 能 力 著 
称 。 卷 积 神经 网 络 中 作为 深度 学 习 的 重要 一 员 ， 主 
要 运用 于 二 维 图 像 识 别 中 ， 具 有 如 下 优点 : CD 可 
以 从 大 量 的 样本 中 自动 学 习 数 据 的 特征 ， 省 去 了 传 
统 方法 复杂 繁琐 的 特征 提取 过 程 ， 减 少 了 对 专家 知 
识 的 依赖 。 (20 结构 采用 局 部 连接 、 权 值 共享 等 手 
段 ， 极 大 减 小 了 网 络 参 数 规模 ， 降 低 了 训练 难度 ， 
提高 了 训练 速度 、 使 得 网 络 泛 化 能 力 增强 。 

近年 国内 外 学 者 开始 尝试 将 卷 积 神经 网 络 运 
用 于 旋转 机 械 故 障 诊 断 中 ， 主 要 应 用 于 轴承 故障 诊 
断 。2016 年 中 国 石 油 大 学 Wang Jinjiang 四 采用 卷 积 
神经 网 络 进行 旋转 机 械 故 障 诊 断 ， 卷 积 神经 网 络 的 


最 新 的 卷 积 神经 网 络 DenseNett3] 结 构 , 简化 了 网 络 
结构 ， 解 决 了 变 工 况 下 行星 齿轮 箱 的 复杂 故障 诊断 


问题 。 


1 故障 树 形 结构 及 多 SoftMax 卷 积 神 


经 网 络 


1.4 卷 积 神经 网 路 的 发 展 

1998 年 ，Yann Lecun 等 09 提 出 了 LeNet-5,. X 
用 基于 梯度 下 降 法 的 反 向 传播 算法 对 网 络 进行 训 
练 ， 并 在 手写 数字 数据 库 MNIST 上 取得 了 成 功 。 
因此 卷 积 神经 网 络 引起 了 学 术 界 的 关注 ， 也 逐渐 应 


输入 直接 采用 截取 的 一 维 振动 数据 ; 2017 年 北京 航 
天 航空 大 学 的 Chen Lul, 哈尔滨 工业 大 学 的 Zhang 
Weillg 以 及 西安 交通 大 学 的 Liu Ruonan00 等 都 采用 


通过 将 一 维 振动 信号 拼接 成 二 维 信号 ， 再 作为 卷 积 
神经 网 络 输入 进行 故障 诊断 ; 2017 年 加 拿 大 英 属 哥 


伦比 亚 大 学 的 Min Xia03 提 出 了 基于 多 传感器 融合 
的 卷 积 神经 网 络 的 旋转 机 械 故 障 诊断 。 上 述 的 论文 
中 存在 某 些 不 足 : 

(1) 卷 积 神经 网 络 的 输入 样本 长 度 是 人 为 随 
意 给 定 的 固定 数值 ， 难 以 推广 到 不 同 采 样 频 率 ， 不 
同 转速 的 工 况 。 

(2 ) 主 要 用 于 诊断 轴承 ， 故 障 比较 明显 ， 振 动 
波形 差别 大 ， 而 在 行星 齿轮 箱 的 故障 诊断 中 ， 振 动 
波形 差别 很 小 ， 诊 断 难 度 远 大 于 轴承 。 

(3) 工 况 较 为 简单 ， 转 速 固定 或 者 变化 范围 很 
小 ， 没 有 研究 变 工 况 的 诊断 问题 。 

(4) 对 于 复合 故障 ， 采 用 的 方法 是 将 复合 故障 
设置 一 个 独立 的 类 , 不 能 查看 单个 故障 诊断 的 效果 。 

针对 上 述 利用 卷 积 神经 网 络 进行 旋转 机 械 故 
障 诊断 存在 的 不 足 ， 本 文 提 出 了 改进 方案 ， 有 效 地 
解决 了 行星 齿轮 箱 的 故障 诊断 问题 ， 本 文 的 创新 点 
包括 : 

(1) 给 出 样本 数据 长 度 的 计算 公式 ， 能 适应 不 
同 转速 、 不 同 采样 频率 的 工 况 。 同 时 采用 随机 截取 


方式 创建 样本 ， 使 得 网 络 泛 化 能 力 更 强 ， 测 试 时 也 
更 加 方便 。 
《2) 提 出 故障 树 形 结构 ， 能 统一 处 理 单一 和 复 


合 故 障 ， 并 能 查看 各 个 节点 诊断 的 效果 。 
(3) 为 了 实现 故障 树 形 结构 的 诊断 问题 ， 提 出 
了 多 SoftMax 的 网 络 结构 。 
(4) 本 文采 用 大 的 卷 积 窗口 、 大 的 池 化 步 长 和 


用 在 语音 识别 、 人 脸 识别 、 物 体 识别 等 领域 。 

2012 年 ，Hinton 及 其 学 生 Alex Krizhevsky 等 
人 提出 了 AlexNet05 网 络 模型 ， 并 在 大 型 图 像 数 据 
Æ ImnageNet09 的 竞赛 中 , 以 比 第 二 名 高 出 11% 的 巨 
大 优势 取得 了 胜利 。 一 时 间 卷 积 神经 网 络 成 为 了 学 
术 界 的 焦点 。 之 后 ， 和 牛津 大 学 提出 了 VGGNetl, 
谷歌 提出 了 GoogLeNetl18]， 微 软 提出 了 ResNetl?l, 
这 些 网 络 不 断 刷 新 了 AlexNet 创下 的 记录 。2016 年 
12 月 康 奈 尔 大 学 、 清 华 大 学 和 FaceBook 提出 了 
DenseNet， 进 一 步 减少 了 网 络 规模 ， 降 低 了 训练 难 
E, 提高 了 网 络 的 泛 化 能 力 , 被 评 为 2017 CVPR E 
际会 议 最 优 论文 ， 成 为 卷 积 神经 网 络 的 最 优 结构 。 
1.2” 卷 积 神经 网 路 的 结构 

传统 的 卷 积 神经 网 络 一 般 由 输入 层 、 卷 积 层 、 
非 线性 激活 层 、 池 化 层 、 全 连接 层 、SoftMax 输出 
层 组 成 。 核 心 为 卷 积 层 ， 非 线性 激活 层 ， 池 化 层 。 
如 图 1 所 示 是 卷 积 神经 网 络 的 典型 结构 。 


| 


卷 积 层 池 化 层 全 连接 层 输出 层 


输入 层 卷 积 层 WEE 
图 1 卷 积 神经 网 络 典 型 结构 


卷 积 层 运 用 卷 积 核 完成 从 上 一 层 到 下 一 层 的 
RER. X, 表示 第 i 层 的 特征 图 ， 卷 积 神经 网 络 
HAE RER, HXI 表示 。 卷 积 层 的 操作 
表示 为 


X,=X, OW+b, (1) 
其 中 : W, 为 第 i 层 的 卷 积 核 的 权 值 第 阵 ，@ 表 
示 卷 积 运算 ，b 为 第 i 层 的 偏 移 向 量 。 
非 线 性 激活 层 通 过 非 线 性 函数 ， 完 成 从 上 一 层 
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到 下 一 层 的 特征 映射 ， 表 示 为 
X, FX) (2) 
其 中 : F 为 非 线性 函数 ， 常 用 的 非 线性 函数 有 
ReLU 函数 及 其 变 体 Leaky ReLU, Random ReLU, 
Parametric ReLU, Shifted ReLU, Exponential LUP, 
池 化 层 : 对 特征 图 进行 降 采 样 ， 一 方面 可 以 对 
特征 图 进行 降 维 ， 另 一 方面 又 可 以 减少 卷 积 神经 网 
络 参 数 。 最 常见 的 是 最 大 值 池 化 ， 表 示 为 
X,la b)= max (Xla*s+p p*s+p)) (3) 
(0<p,q<s) 
其 中 : s*s 是 池 化 层 窗 口 尺寸 ，a 和 b 是 像素 
坐标 。 
卷 积 神经 网 络 的 目标 是 使 损失 最 小 ， 损 失 包 括 
US AUS RU AR ABS, — 283 XUSE d$ H3 E) e oc SC A0 
失 ， 结 构 风 险 通常 是 权重 的 二 范 数 。 
1.3 ”故障 树 形 结构 
实际 情况 下 ， 故 障 类 型 可 能 特别 复杂 ， 有 单一 
故障 、 复 合 故障 ， 各 种 故障 的 程度 不 一 等 等 ， 为 了 
能 统一 处 理 各 种 故障 情况 ， 设 计 了 故障 树 形 结构 ， 


有 具体 如 图 2 所 示 。 
SoftMax1 
正常 有 故障 
SoftMax2 | 
单一 故障 复合 故障 
SoftMax3 | SoftMax4 | 
太阳 轮 | 轴承 5 22 太阳 轮 + 轴 承 | 行星 轮 + 轴 承 | .………。 
— | ko mm | bai a _SofiMax8 
aaea.. 动 | 外 | .| aale.. 动 | 外 
齿 | 纹 | 损 | 齿 BB EIE SEE: II 
l e md. | l 
轻 | 中 | 较 | 严 | .| | 轻 | 中 | 较 | 严 |...| | 轻 | 中 | 较 | 严 |... 轻 | 中 | 较 | 严 
微 | 等 | 重 | 重 微 | 等 | 重 | 重 微 | 等 | 重 | 重 微 | 等 


图 2 行星 齿轮 箱 故 障 树 形 结构 

故障 树 形 结构 中 ， 正 常 〈 无 故障 ) 和 有 故障 为 
故障 树 的 根 节 点 ， 往 下 分 又 出 节点 ， 直 到 叶 节 点 。 
正常 为 叶 节 点 ， 有 故障 分 为 单一 故障 和 复合 故障 。 
单一 故障 分 为 太阳 轮 、 轴 承 、 行 星 轮 和 行星 架 等 不 
同 零 部 件 故障 ， 对 于 太阳 轮 故 障 分 为 断 上 大、 和 裂纹、 
磨损 、 缺 具 等 不 同 故 障 类 型 ， 太 阳 轮 裂纹 故障 等 根 


单 建华 等 ， 基 于 卷 积 神经 网 络 的 行星 齿轮 箱 故障 诊断 


构 ， 如 图 3 所 示 ， 根 据 实 际 工 况 ， 确 定 几 个 典型 的 
转速 和 载荷 。 如 果 有 其 他 工 况 属 性 也 可 以 加 到 工 况 
并 列 结构 中 。 


图 3 工 况 并 列 结构 
1.5 多 SoftMax 卷 积 神经 网 络 的 结构 
多 SoftMax 卷 积 神经 网 络 结构 包含 输入 层 、 卷 
积 层 、 最 大 池 化 层 、 平 均 池 化 层 、 多 SoftMax 输出 
层 ， 多 SoftMax 输出 层 是 输出 层 有 多 个 SoftMax 得 
分 向 量 ， 得 分 向 量 集 合 为 8 = {SofiMaxili = L..,m] j 
如 图 4 所 示 ， 每 个 SofiMaxi 与 最 后 一 层 特征 层 是 全 
连接 。1.2 节 介 绍 的 传统 的 卷 积 神经 网 络 是 多 
SoftMax 卷 积 神经 网 络 的 特例 ， 即 输出 层 只 有 一 个 
SoftMax 得 分 向 量 。 


Y 
SoftMax1 SoftMax2 


图 4 多 SoftMax 卷 积 神经 网 络 结构 

多 SoftMax 卷 积 神经 网 络 的 经 验 风 险 损 失 与 传 
统 的 卷 积 神经 网 络 差别 很 大 。 以 图 2 为 例 ， 某 个 行 
星 齿轮 箱 的 故障 类 型 是 太阳 轮 出 现 故 障 ， 但 不 知道 
太阳 轮 具体 哪个 位 置 出 故障 ， 则 对 应 SoftMax 得 分 
向 量 下 标 集 为 : {1 2 3}， 某 个 行星 齿轮 箱 的 故障 类 
型 是 太阳 轮 出 现 裂 纹 故障 ， 且 是 中 等 程度 ， 则 对 应 
SoftMax 得 分 向 量 下 标 集 为 : {1 23 5 9}。 可 见 ， 样 


据 故 障 程度 分 为 轻微 、 中 等 、 较 重 等 故障 程度 。 同 
理 可 得 到 其 他 零 部 件 故障 结构 。 复 合 故障 是 多 个 零 
件 出 现 故障 ， 不 限于 两 个 零 部 件 。 通 过 每 个 零 部 
件 故障 的 组 合 ， 可 得 到 复合 故障 。 

对 于 其 他 机 械 的 故障 类 型 ， 可 同样 设计 相应 的 
故障 树 形 结构 。 
14 工 况 并 列 结构 

行星 齿轮 箱 除了 有 不 同 的 故障 类 型 ， 还 存在 变 
工 况 ， 即 转速 和 载荷 会 发 生变 化 。 设 计 工 况 并 列 结 


AS 


ng 


本 对 应 多 个 SoftMax 得 分 向 量 ， 而 且 SoftMax 得 分 
向 量 的 数目 是 不 定 的 。 

样本 包含 的 SoftMax 得 分 向 量 除了 故障 树 形 结 
构 中 的 SoftMax 得 分 向 量 ， 也 包含 工 况 并 列 结构 中 
的 SoftMax 得 分 向 量 。 如 图 3， 如 果 是 转速 2 和 载 
荷 3， 则 工 况 并 列 结构 的 SoftMax 得 分 向 量 下 标 集 
为 : (40 11} 。 故 障 树 形 结构 和 工 况 并 列 结构 同时 存 
在 时 ， 样 本 包括 两 者 的 SoftMax 得 分 向 量 。 结 合 图 
2 和 图 3, 单一 故障 下 的 轴承 外 圈 故 障 , 工 况 为 转速 
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1， 载 荷 2， 则 对 应 SoftMax 得 分 向 量 下 标 集 为 :{1 
2361011}。 

多 SoftMax 卷 积 神经 网 络 的 经 验 风险 损失 是 样 
本 包含 的 多 个 SoftMax & 47 In] 5 HI SCR KAIF 
均值 。 单 个 SoftMaxi 得 分 向 量 的 经 验 风险 损失 为 : 


e” (4) 


j=l 


式 中 sm 是 SoftMaxi IN AE, n 是 SoftMaxi EX, 
yi 73 SoftMaxi 得 分 向 量 对 应 的 标签 值 。 


样本 的 风险 损失 为 : 
-l l 
ish” 6) 
式 中 , Si (Sie S) 为 样本 的 SoftMax 得 分 向 量 集合 ， 
SARE Si 元 素数 目 。 


根据 式 (5) ， 此 时 在 经 验 风险 损失 反 向 梯度 传 


以 前 的 网 络 结构 在 DenseNet 基础 上 设计 。 输 入 层 为 
H*1*K， 其 中 H 为 样本 数据 长 度 ，1 是 数据 宽度 ， 
K 为 数据 维度 即 传感器 数目 。 采 用 多 个 传感器 采集 
信号 ， 同 时 利用 多 个 传感器 采集 的 信号 进行 故障 诊 
断 可 以 提高 诊断 的 准确 率 ， 相 当 于 在 数据 层 进 行 了 
多 传感器 融合 。 
G) 训练 卷 积 神经 网 络 : 利用 训练 数据 库 训 练 
多 SoftMax 卷 积 神经 网 络 ， 每 次 mini-batch 〈 批 量 
O 训练 网 络 ， 每 次 mini-batch 包含 的 样本 均 不 同 ， 
直到 训练 结束 ， 这 样 每 个 样本 只 参与 一 次 训练 。 所 
有 这 些 mini-batch 样本 构成 了 训练 集 。 调试 超 参数 ， 
获得 较 好 的 卷 积 神经 网 络 参数 ,提高 网 络 泛 化 性 能 。 
(4) 诊断 行星 齿轮 箱 故障 : 将 待 诊断 行星 齿轮 
箱 的 样本 数据 输入 训练 好 的 多 SoftMax 卷 积 神经 网 
络 中 ， 得 到 多 SoftMax 得 分 向 量 。 
对 于 故障 树 形 结构 的 SoftMax 得 分 向 量 ， 首 先 
从 根 节点 的 SoftMax 得 分 向 量 开始 ， 根 据 最 大 值 位 
置 往 下 判断 ， 直 到 叶 节 点 退出 。 以 图 2 为 例 ， 首 先 


递 时 , 只 需 传递 Si 集合 中 SoftMax 得 分 向 量 的 梯度 ， 
S-Si 中 SoftMax 得 分 向 量 的 梯度 不 要 反 向 传递 。 

确定 样本 标签 的 方法 为 : 样本 每 个 SofiMaxi 得 
分 向 量 对 应 标签 的 一 个 元 素 ， 元 素 取 值 为 该 
SofiMaxi 得 分 向 量 中 相应 属性 的 序号 (序号 从 1 开 
始 ) 。 如 SoftMax3 是 轴承 故障 ， 则 标签 该 元 素 值 为 
2; 某 个 行星 齿轮 箱 的 故障 类 型 是 太阳 轮 出 现 裂 纹 故 
障 ， 且 是 中 等 程度 ， 则 标签 为 [2 1 1 22]. 


2 行星 齿轮 箱 故障 诊断 方法 流程 


多 SoftMax 卷 积 神经 网 络 进行 行星 齿轮 箱 故 障 
诊断 时 ， 分 为 四 个 步骤 : 创建 训练 数据 库 、 创 建 多 
SoftMax 卷 积 神经 网 络 、 训 练 多 SoftMax 卷 积 神经 
网 络 以 及 诊断 行星 齿轮 箱 故障 。 

《1) 创 建 训练 数据 库 : 训练 数据 库 的 创建 分 为 
样本 数据 的 创建 和 样本 标签 的 创建 。 对 于 每 种 工 况 
下 采样 数据 ， 采 用 随机 方式 创建 ， 即 在 随机 位 置 处 
截取 振动 数据 中 大 于 一 个 最 大 数据 周期 长 度 〈 即 最 
低 转速 下 ， 行 星 齿 轮 箱 旋转 一 周 ， 采 样 数据 点 的 个 
数 ) 的 连续 数据 点 作为 一 个 样本 数据 ， 优 先 选 择 
Kk*2" 个 数据 点 作为 一 个 样本 数据 ， 其 中 大 、n 为 正 
整数 ， 随 机 创建 方式 的 优点 是 模型 泛 化 能 力 强 。 重 
复 上 述 样本 数据 创建 过 程 ， 创 建 足够 多 的 样本 数据 
作为 训练 数据 库 ， 接 着 根据 故障 树 形 结构 和 工 况 并 
列 结构 创建 样本 的 标签 。 

(2) 创建 多 SoftMax 卷 积 神经 网 络 : 创建 多 
SoftMax 卷 积 神经 网 络 卷 积 时 ， 多 SoftMax 输出 层 


从 根 节点 SoftMax1 得 分 向 量 即 有 无 故障 开始 判断 ， 
判断 方法 为 : 得 分 向 量 中 最 大 值 所 在 位 置 如 果 在 1, 
则 判断 正常 ， 由 于 正常 是 叶 节 点 ， 所 以 直接 退出 。 
如 果 位 置 在 2， 则 判断 为 有 故障 ， 继 续 往 SoftMax2 
判断 。 其 他 SoftMax 判断 方式 与 SoftMaxl 一 样 ， 
SoftMax2 得 分 向 量 如 果 判 断 为 单一 故障 , 则 复合 故 
障 不 需 判 断 。 
工 况 并 列 结构 直接 判断 即 可 。 最 后 得 到 样本 诊 
为 了 提高 诊断 可 靠 性 ， 可 采集 多 个 样本 ， 对 每 
个 样本 都 得 到 相应 标签 ， 采 用 出 现 次 数 最 多 的 标签 
作为 最 终 标签 , 获得 行星 齿轮 箱 的 故障 类 型 和 工 况 。 


3 行星 齿轮 箱 故 障 诊断 实例 


本 实例 采用 实验 室 行星 齿轮 箱 实验 装置 自 测 
故障 数据 ， 实 验 装 置 如 图 5 所 示 ， 运 用 两 个 传感器 
采集 振动 数据 。 


1 号 传感器 行星 齿轮 箱 


5 本 实验 室 
行星 齿轮 箱 参数 如 表 1 所 示 。 


单 建华 等 ， 基 于 卷 积 
表 1 实验 行星 齿轮 箱 参 数 
Nerd 太阳 轮 ”行星 轮 MAE TER 
齿 数 28 36 100 一 
模 数 (mm) 1 1 1 一 
压力 角 (deg) 20 20 20 一 
齿 宽 (Omm) 10 10 10 一 
质量 (kg) 0.069 0.057 0.422 0.709 
节 圆 直径 Cmm) 28 36 100 一 
实验 中 有 四 种 太阳 轮转 速 : 10Hz、15Hz、20Hz 
和 25Hz。 由 于 实验 限制 ,相对 于 图 2 的 故障 树 形 结 
构 ， 故 障 类 型 做 得 较为 简单 。 太 阳 轮 单一 故障 有 上 断 


也 故障 类 型 差别 较 大 ， 但 磨 


他 故障 类 型 的 振动 模式 


， 采 样 的 数据 点 数 为 


经 网 络 的 行星 齿轮 箱 故 障 诊断 
下 ， 磨 损 振动 模式 与 其 
损 振 动 模式 与 其 他 工 况 下 其 
较为 相似 ， 如 (1) 中 磨损 与 (2) PRA. AIR 
动 模式 很 明显 ， 容 易 识别 。 
3.1 创建 数据 库 
振动 数据 的 采样 频率 为 8192Hz， 最 小 转 频 为 
10Hz， 此 时 太阳 轮 旋转 一 圈 
820，820 为 数据 周期 。1280 是 超过 数据 周期 820 


且 是 符合 k*2" 的 整数 ， 


作为 一 个 的 样 
本 数据 长 度 相对 较 短 ， 有 利于 降低 多 SoftMax 卷 积 
神经 网 络 结构 的 复杂 度 和 训练 


其 中 k=5，n=8。 每 种 工 况 下 
的 振动 数据 ,在 随机 位 置 处 截取 1280 个 连续 数据 点 


本 数据 ， 妇 


1 图 7 所 示 ， 这 样 选取 的 样 


E 度 ， 同 时 能 加 快 训 


齿 、 有 裂纹 磨损 和 缺 齿 , 转 频 为 10Hz、20Hz 和 25Hz; 


复合 故障 包含 太阳 轮 故 障 和 轴承 外 轿 


故障 ， 太 阳 轮 


HIENA RE ARAMA, PIAN 15Hz 和 
20Hz. Bii A A R A JEER r PART o 


练 速 度 。 采 用 随机 方式 创建 样本 数据 ， 在 实际 测试 


时 ， 无 需 从 囊 


c 


定点 截取 测试 数据 ， 使 得 测试 更 为 简 


便 。 而 且 由 于 是 位 置 是 随机 的 ， 到 
够 多 的 样本 数量 。 


E 论 上 可 以 创建 足 


EX — Wi o BA MS M 
0.2 : 
E 0 0.1 
ug -0.1 ? 
7 25 i | | | .i = P 
3000 6000 9000 12000 15000 z -01 
(1) 10Hz、 无 载荷 单一 故障 
ES à Ks ao BR ps bus 
-0.3 
w 0 500 1000 1500 2000 2500 3000 
Z 采样 个 数 
g -0. | | | | i 图 7 样本 数据 创建 
-0.2 i i i i i (1) 故障 树 形 结构 
3000 6000 9000 12000 15000 -— a 
(2) 15Hz， 有 载荷 复合 故障 | pm | sm | 
正常 Bras 裂纹 磨损 Mus 
0.2 Sof Max? A 
SO me sad 
* 
E 0 | 
z 0.1 i SoftMax5 | SoftMax7 | 
= y 1 : : JEE JEIJE 
pe bo o i — 0 N EHHE EHHH 
3000 6000 9000 12000 15000 (2) 工 况 并 列 结构 
(3》20Hz、 无 载 答 复合 故障 dl 
正常 Bras mu 磨损 缺 齿 
SoftMaxl l 
CN 
Dung 
zd (3) 多 softMax 输出 层 
x B5 : si |s |ss |s lso 
3000 6000 9000 12000 15000 
(4) 25Hz、 有 载荷 单一 故障 图 8 本 实例 故障 树 形 结构 ， 工 况 并 列 结 构 及 多 SoftMax 输 


[| 


6 不 同 工 况 下 振动 波 


图 


出 层 形式 


不 同 工 况 下 振动 波形 图 如 图 6 所 示 , 可 以 发 现 ， 本 实验 对 应 的 故障 树 形 结构 和 工 况 并 列 结构 如 
同 种 工 况 下 正常 、 断 齿 、 裂 纹 振动 波形 很 接近 ,说 图 8 所 示 ， 对 应 图 2 和 图 3 的 SoftMax 得 分 向 量 
明 行 星 齿 轮 箱 的 故障 诊断 难度 比较 大 。 在 相同 工 况 。 标 集 为 [1 2 3 4 5 7 8 10]， 由 于 图 2 中 的 SoftMax 
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得 分 向 量 下 标 集 [3 4 8] 只 有 一 个 属性 值 ， 因 此 这 三 
个 SoftMax 得 分 向 量 可 以 省 略 。 最 终 故 障 树 形 结构 
和 工 况 并 列 结构 只 需 SoftMax 得 分 向 量 下 标 集 为 [1 
2 57 10] 。 标 签 创 建 方式 如 1.5 节 ， 例 如 : 对 于 转 
速 20Hz， 故 障 为 单一 故障 下 的 磨损 故障 的 工 况 ， 则 
标签 为 [2 1 3 3]. 
3.2 多 SoftMax 卷 积 神经 网 络 结构 

卷 积 层 采 用 大 的 卷 积 核 和 大 步 长 ， 池 化 层 同样 
采用 大 的 池 化 窗口 和 步 长 ， 可 以 减少 网 络 层 数 。 激 
活 层 的 激活 函数 为 Max(-1,X)。 为 解决 网 络 层 数 太 
深 导 致 难以 训练 以 及 网 络 太 浅 导致 特征 提取 不 够 好 
的 问题 , 参考 了 DenseNet, 在 网 络 中 加 入 了 双 路 径 ， 
网 络 具体 结构 如 图 9 所 示 。 


I 输入 层 


CI 卷 积 层 
P1 最 大 池 化 层 


AP2 平均 池 化 层 


路 径 1 | 路 径 2 
C4 卷 积 层 


API 平均 池 化 层 


FC 全 连接 层 | 


Y 


S 多 SoftMax 输 出 层 
S1; S2; S3; S4; S5 


i O 输出 层 (标签 ) 
图 9 实验 采用 的 多 SoftMax 卷 积 神经 网 络 
各 层 的 具体 参数 如 下 表 : 
表 2 多 SoftMax 卷 积 神经 网 络 各 层 参 数 
层 编号 层 运算 算 子 尺寸 ÆR ”特征 图 大 小 
I 输入 == == 1280*1*2 
CI 卷 积 15*1 1*1 1280*1*48 
PI 最 大 池 化 6*1 4*1 321*1*48 
C2 卷 积 7*1 1*1 321*1*96 
P2 最 大 池 化 6*1 4*1 80*1*96 
C3 卷 积 5*1 1*1 80*1*192 
P3 最 大 池 化 2#1 2*1 40*1*192 
C4 卷 积 5*1 1*1 40*1*192 
AP2 平均 池 化 一 一 一 一 1*1*192 
AP1 平均 池 化 = 1*1*192 
FC 全 连接 mE = 1*1*384 
S 多 SoftMax 输出 一 一 一 一 1*1*16 


O 输出 标签 mE Eu 1*1*5 


3.3 测试 一 

训练 时 超 参 数 设 置 为 ， 当 迭代 次 数 i<7000 时 ， 
学 习 速 率 为 0.001， 正 则 化 系数 为 0.00001， 
mini-batch 〈 批 量 数 ) 为 32， 动 量 系数 为 0.9; i 
27000 时 ， 学 习 速 率 为 0.0005， 正 则 化 系数 为 
0.00001, mini-batch 〈 批 量 数 ) 为 32， 动 量 系数 为 
0.9; 权重 初始 化 为 高 斯 分 布 的 随机 数 ， 均 值 为 零 ， 
方差 为 0.1， 偏 置 初 始 化 为 零 。 振 动 波 形 数据 乘 以 
10, 作为 输入 数据 。 训 练 采用 提前 终止 法 , 在 21400 
次 停止 训练 ， 训 练 结 束 并 测试 测试 集 的 准确 率 。 

每 个 工 况 采集 了 100 个 样本 作为 测试 数据 集 ， 
诊断 效果 采用 两 个 指标 ， 第 一 个 指标 是 所 有 样本 的 
准确 率 ， 诊 断 结 果 与 给 定 标 签 完全 一 致 ， 才 算 诊 断 
正确 ， 准 确 率 为 97.55%。 可 见 ， 本 方法 能 准确 诊断 
行星 齿轮 箱 的 复杂 故障 类 型 。 


ET: | E | m 


OAIE: 断 齿 
97.60 | 98.44 | 97.36 | 96. 56 


E 99.61 | 9986 | 99. 86 


转速 《Hz) 
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10 15 20 25 


100 |99.28 | 99.07 | 100 


图 10 测试 一 各 节点 查 全 率 

另 一 种 是 查看 树 形 结构 图 和 工 况 并 列 结构 中 各 
个 节点 的 查 全 率 ， 如 图 10。 查 全 率 也 叫 召 回 率 ， 其 
定义 为 某 类 样本 中 被 诊断 正确 的 比例 。 举 例如 下 : 
对 于 单一 故障 的 查 全 率 为 99.96%, 意义 是 符合 单一 
故障 的 样本 被 诊断 为 单一 故障 的 比例 。 
3.4 测试 二 

在 测试 1 中 ， 训 练 样本 的 工 况 和 测试 样本 的 工 
况 是 相同 的 ， 但 在 实际 中 ， 行 星 齿 轮 箱 的 工 况 复杂 
多 变 ， 训 练 样本 中 难以 包含 所 有 工 况 ， 所 以 为 了 检 
验 多 SoftMax 卷 积 神经 网 络 对 载荷 的 泛 化 能 力 ， 在 
测试 二 中 ， 将 行星 齿轮 箱 无 载荷 工 况 的 振动 数据 作 
为 训练 样本 ,有 载荷 工 况 的 振动 数据 作为 测试 样本 。 

测试 二 中 样本 标签 与 测试 一 相同 ， 多 SoftMax 
卷 积 神经 网 络 与 测试 一 相同 。 

训练 时 超 参数 设置 与 测试 一 基本 相同 ， 只 是 迭 
代 次 数 不 同 而 已 。 迭 代 次 数 到 4000 次 ,改变 学 习 率 ， 
6000 次 停止 训练 。 迭 代 次 数 明显 小 于 测试 一 ， 说 明 
训练 难度 降低 。 

对 有 载荷 的 每 种 工 况 提取 100 个 测试 样本 ， 样 
本 准确 率 为 88.83%， 再 计算 各 个 节点 的 查 全 率 ， 如 


9 11 所 示 。 
| 正常 m" 
| 9941 98.67 
单一 地 障 复合 故障 | 
9692 9983 | 
断 齿 | 裂纹 | 磨损 | 缺 直 | [ma zz |en ra 
89.22 [356 |997s | 100 85.39 |94.56 | 89.78 | 90.1 


转速 (Hz》 
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100 | 99.28 9907| 100 


图 11 测试 二 各 节点 查 全 率 
测试 二 中 ， 训 练 样本 和 测试 样本 的 载荷 存在 差 
别 ， 准 确 率 88.83% 明 显 低 于 测试 一 的 97.55%。 但 


每 种 工 况 下 可 以 截取 多 个 样本 ， 例 如 取 100 个 ， 这 


单 建华 等 ; 基于 卷 积 神经 网 络 的 行星 齿轮 箱 故障 诊断 


| | 


磨损 | 缺 齿 断 齿 | 裂纹 | 磨损 | RE 
100 | 100 
图 12 测试 三 各 节点 查 全 率 
测试 三 的 准确 率 明显 低 于 测试 一 和 测试 二 的 准 
确 率 ， 说 明 测试 三 的 难度 很 大 ， 这 表明 转速 对 振动 
波形 的 影响 远大 于 载荷 。 通 过 正常 行星 齿轮 箱 在 不 
同 转速 下 的 振动 波形 图 可 以 验证 这 点 ， 如 图 13 所 
示 。 计 算 了 波形 图 各 点 幅 值 绝对 值 的 平均 值 ， 结 果 
如 下 : 10 到 25Hz 分 别 为 0.0032,0.0056,0.0075， 
0.012m/s2， 最 大 差别 达到 4 fii. 

虽然 测试 样本 ;准确 率 为 76.37% 偏 低 , 但 是 在 判 
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所 有 无 故障 ,及 单一 还 是 复合 故障 时 , 查 全 率 很 高 ， 
基本 是 100%。 准 确 率 低 主要 是 由 于 部 分 故障 类 型 


些 样 本 出 现 次 数 最 多 的 故障 类 型 代表 行星 齿轮 箱 最 
终 故 障 类 型 。 即 使 单个 样本 是 88.83% 的 准确 率 , 但 
行星 齿轮 箱 故 障 类 型 出 现 误 判 的 的 概率 也 很 低 。 
通过 图 11 可 以 发 现 , 复合 故障 的 查 全 率 远 高 于 
其 下 节点 的 查 全 率 ， 这 说 明 复 合 故障 的 样本 基本 都 
诊断 为 复合 故障 ， 但 是 很 大 一 部 分 样本 的 具体 故障 
类 型 诊断 错 了 ， 例 如 诊断 错误 的 断 齿 样本 有 很 大 比 
例 诊断 为 磨损 。 这 点 体现 了 故障 树 形 结构 的 优点 ， 
如 果 不 考 虑 故障 类 型 ， 只 考虑 故障 有 无 或 单一 还 是 
复合 故障 ， 查 全 率 是 很 高 的 ， 最 低 的 达到 96.9296. 
3.5 测试 三 

行星 齿轮 箱 很 多 情况 下 工作 在 变 工 况 下 ， 转 速 
会 发 生 很 大 波动 ,所 以 训练 工 况 难以 包括 所 有 转速 ， 
故 需 验证 多 SoftMax 卷 积 神经 网 络 对 转速 的 泛 化 能 
力 。 在 测试 三 中 ，10Hz、15Hz 和 25Hz 转 频 工 况 下 
的 振动 数据 作为 训练 数据 , 20Hz 的 振动 数据 作为 测 
试 数据 。 测 试 三 不 再 包括 转速 得 分 向 量 。 多 SoftMax 
输出 层 前 的 网 络 结构 和 测试 一 相同 。 

训练 时 超 参数 设置 与 测试 一 基本 相同 ， 只 是 迭 
代 次 数 不 同 而 已 。 达 代 次 数 到 1500 次 , 改变 学 习 率 ， 
5500 次 停止 训练 。 和 迭代 次 数 明 显 小 于 测试 一 ， 说 明 
训练 难度 降低 。 

训练 停止 后 ， 对 每 种 工 况 创 建 100 个 样本 作为 
测试 样本 , 测试 样本 准确 率 为 76.37%， 以 及 测试 样 
本 的 各 个 节点 查 全 率 如 图 12 所 示 。 


判断 错误 所 致 ,如 复合 故障 下 的 断 齿 基本 识别 错 了 ， 
及 裂纹 大 部 分 识别 错 了 。 
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13 不 同 转 频 下 无 故障 时 振动 波形 图 
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(1) 首 次 提出 了 故障 树 形 结构 和 工 况 并 列 结构 ， 
能 统一 处 理 各 种 复杂 的 故障 类 型 和 变 工 况 ， 同 时 能 
查看 各 个 节点 的 诊断 效果 。 
(2) 首 次 提出 了 多 SoftMax 卷 积 神经 网 络 ， 能 处 
理 故 障 树 形 结构 和 工 况 并 列 结 构 。 并 借鉴 了 
DenseNet 网 络 结构 ， 使 得 训练 更 加 容易 。 同 时 激活 
函数 采用 Max(-1,X)。 

(3) 采 用 上 述 方法 成 功 的 诊断 了 实验 室 的 行星 
齿轮 箱 各 种 故障 类 型 ， 测 试 一 的 准确 率 达 至 
97.5596. 
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